查看原文
其他

一杯茶一本书 读懂阿里巴巴"双11"8年技术保卫战

2017-04-19 老鱼 老鱼笔记

喝茶醒神,读书清心。在古代,对于文人骚客来说,饮茶与读书是一样的风雅。书室之内,燃上一柱香,泡上一壶茶,淡淡的清香营造出一种幽静的氛围,意境很典雅,用现在时髦点的话说,就是“有品位”。


4月12日,阿里巴巴技术团队在京就办了一场有品位的分享会,在一个佛堂环境,用一杯茶,一个本书,为我们揭秘“双11”这一世界级经济现象背后的技术支撑。

茶是禅茶,书是阿里巴巴集团唯一官方出品的《尽在双11——阿里巴巴技术演进与超越》。该书被阿里巴巴集团CTO行癫盛赞为“迄今为止对双11技术演进最客观、最详实的还原。”

双11始于2009年的一个突发奇想,由最初几个人被临时安排值班,交易额不到6亿,高峰每秒只有400个请求,8年之后,迅速增长为参战BU多达23个,数千位技术人员,2016年双11单日交易额定格在1207亿元,高峰每秒请求高达17.5万,震惊全球。

如今,双11不仅是一场整个阿里及其生态联动的战役,更是成为整个互联网生态的双11,这一技术的盛宴,业务的狂欢背后,又有怎样不为人知的故事?

分享会上,来自天猫技术质量部总监、连续5年双11测试负责人霜波,阿里中间件资深技术专家,双11稳定性技术负责人叔同、认知计算实验室负责人袁全分别就不同角度,为我们解读了“双11”风光背后却充满荆棘的技术演进与超越。

开始分享前,霜波首先抛出一个问题,“你们知道商家对双11最大的期望是什么吗?”

“卖更多的货?”有人答道。

不对,她指出,商家最大的需求不是卖多少货,而是系统稳定。

至于缘由,她则从一个故事说起。

在2012年6月,双11商家沟通会上,阿里巴巴的技术团队问商家:“对双11最大的期望是什么?”

反馈最多的期望就是:“系统稳定。”

一个商家站起来说:“去年双11的0点我们被通知下架所有商品,当时团队10多个人,从0点到早上6点,没有一个人敢离开。我们借了款,备了平时10倍的货,如果这个双11卖不掉,我们回家,对家人唯一能说的可能就是“对不起,我破产了”,或者“对不起,我失业了。”

那个晚上,很多人无眠。霜波感触良多的说!

最初的双11是痛苦的,暴增的流量,让工程师措手不及。挂了,重启恢复系统,结果发现商铺和商品图片又出不来了,商品属性丢失,交易和商品系统压挂了,很多商家外部图片空间也给压挂了,折扣错误,超卖了等等问题此起彼伏。

为此,阿里巴巴技术团队做了大量稳定性相关的工作,直到2013年全脸路压测系统正式上线,稳定性问题才真正得到了解决。到了2016年,双11交出了稳定性漂亮成绩单:大问题没有,小问题也没有!全链路方案实际上是通过模拟实际大促时的流量特点,以自动化的方式评估、优化和保护整个交易链条,从而达到确保双11的稳定性。

而类似全链路压测这样的技术创新,在双11中还有很多。如2012年,强弱依赖系统上线、商品价格设置系统上线,2014年,异地双活测试成功、部分系统上云等等。

如果你还想了解更多,在淘宝、天猫等搜索《尽在双11:阿里巴巴技术演进与超越》,即购买。

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存